FILTER MODE ACTIVE

#модели рассуждения

Найдено записей: 3

#модели рассуждения23.06.2025

Reinforcement-Learned Teachers от Sakana AI: Революция в эффективном обучении рассуждению LLM

Sakana AI представляет Reinforcement-Learned Teachers (RLTs) — новый подход, который обучает небольшие модели эффективно преподавать рассуждение большим языковым моделям через RL, ориентированное на создание пошаговых объяснений.

ЧИТАТЬ →

#модели рассуждения22.06.2025

Почему критика Apple в адрес AI-рассуждений преждевременна

Критика Apple в адрес рассуждений AI оспаривается Anthropic, которые доказывают, что ошибки оценки, а не ограничения моделей, вызывают проблемы в решении задач.

ЧИТАТЬ →

#модели рассуждения28.04.2025

Tina: Компактные модели USC с большими успехами в экономичном обучении с подкреплением

Исследователи USC представляют Tina — семейство компактных моделей рассуждения, использующих LoRA и обучение с подкреплением для эффективного достижения высоких результатов с минимальными затратами.

ЧИТАТЬ →